摘要 : 文章 简要 介 


原理 详细 介绍 了 文献 资源 发 现 系 统 的 技术 框架 
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在 数字 图 书馆 环境 下 ， 用 户 为 了 检索 
系统 对 于 普通 用 户 来 说 比较 复杂 ， 
清楚 ， 对 它们 的 特点 难以 区 分 
像 谷 歌 和 百度 那样 的 简 生 


决 方案 。 这 种 解决 方案 将 一 个 检索 请 求 以 合适 的 i 
以 简洁 统一 的 格式 和 最 小 的 如 


合并 检索 到 的 检索 


士 四 
结果 ， 


的 检索 入 


难以 快速 掌握 ; 月 


轧 要 的 资源 ， 


绍 文献 资源 发 现 服 务 系统 的 基本 概念 ， 并 根据 文献 资源 发 现 系统 的 基本 
&， 并 对 其 中 使 用 的 关键 技术 进行 了 简要 说 明 。 


图 书馆 ， 技 术 体 系 ， 关 键 技术 


面临 着 许多 困境 ,图 书馆 传统 的 检索 


户 选择 的 排序 方式 对 结果 集 进行 排序 。 站 


是 各 个 数据 库 的 相应 速度 不 一 样 ， 


昌 户 对 图 书馆 各 种 文献 的 元 数据 标准 不 
; 用 户 很 难 快速 定位 获取 到 所 需 文献 的 全 文 等 用户 更 偏好 于 
一些 数 据 库 商 为 了 解决 这 些 问 题 ， 提 出 了 联邦 检索 解 
下 法 进行 转换 后 发 送 到 一 组 独立 的 数据 库 中 ， 


EE 复 显 示 结 果 ， 提 供 一 个 自动 或 者 用 


晶 是 这 种 解决 方案 也 有 很 多 缺点 ， 最 主要 的 缺点 


根据 木 桶 定律 ， 系 统 


响应 时 间 由 响应 速度 最 慢 的 检索 服务 


器 决定 ; 在 分 布 式 的 网 络 条 件 下 ， 茶 个 检索 服务 器 的 宕 机 可 能 导致 整个 检索 的 失败 ， 这 一 


特性 导致 整个 系统 可 靠 怕 


数据 标准 、 查 询 结果 去 重 困难 


诞生 了 。 它 是 一 种 深度 整合 


它 能 帮助 读者 快捷 


EY 


图 书馆 各 种 类 


比较 脆弱 ， 除 此 意外 ， 联 邦 检索 系统 还 有 资源 集成 没有 统一 的 元 


E 确 地 在 海量 信息 资源 中 查找 所 需 


并 在 查找 过 程 中 获得 最 佳 体 验 。 为 了 适应 网 络 时 代用 户 
似 Google 的 简单 检索 框 ， 极 大 简化 了 相对 比较 复杂 的 图 书馆 传统 检索 界面 。 目 前 国际 上 比 


较 著 名 的 资源 发 现 系 统 有 Summon、 


Primo、 


EDS 等 。 


1、 ”文献 资源 发 现 服务 系统 的 特点 


必须 提供 单一 的 检索 接口 
在 当前 的 互联 网 时 代 ， 


或 者 百度 一 样 的 
个 检索 词 ， 检 索 昌 


各 


到 


合 入 框 检索 引擎 ， 


类 型 


j 户 已 经 习惯 了 提供 单 
有 助 于 提高 有 
的 文献 ， 在 其 中 挑选 自己 需要 


和 相关 度 排序 并 不 是 完全 相关 度 排 序 等 问题 。 中 
由 于 以 上 问题 ， 联 邦 检索 的 用 户 体验 并 不 好 。 作 为 新 一 代 的 图 书馆 检索 系统 ， 资 源 发 现 系统 
型 资源 、 提供 


单一 入 口 的 学 术 资 源 发 现 服 务 平台 ， 
文献 ， 提 供 最 合适 的 获取 服务 集成 ， 
的 检索 习惯 ， 资 源 发现 系 统 提供 了 类 


一 检索 入 口 的 搜索 引擎 。 提 供 类 似 Google 
有 户 的 使 用 体验 。 用 户 可 以 简单 的 输入 一 


的 文献 。 


2， 能 够 帮助 用 户 快捷 、 准 确 找 到 所 需 文献 元 数据 


用 户 需 要 在 海量 


快 ， 返 回 结 果 要 全 


3， 能 够 帮助 用 户 方便 的 获取 到 全 文 文件 
用 户 使 用 资源 发 现 服务 系统 的 最 终 目的 是 获取 所 需要 的 全 文 ， 所 以 系统 要 提供 最 合适 


文献 数据 种 快速 定位 到 自己 所 需要 的 文献 。 这 需要 发 现 系统 检索 速度 要 
面 准确 ;结果 的 排序 规则 要 合理 。 
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的 获取 全 文 服务 集成 ， 并 使 得 用 户 在 获取 过 程 中 获得 最 佳 体验 。 


2、 ”资源 发 现 系统 的 技术 框架 


文献 资源 发 现 服务 系统 的 技术 框架 大 致 可 以 按照 表示 层 、 应 用 层 、 数 据 层 的 三 层 结构 划 
分 。 如 图 1 所 示 : 


资源 发 现 服务 系统 WEB 服 务 


1: 文献 资源 发 现 服务 系统 的 技术 框架 
数据 层 


数据 层 包 括 支 撑 系 统 运 行 的 若干 底层 数据 库 ， 包 括 用 户 数据 库 、 母 体 信 息 库 、 用 户 评价 
库 、 资 源 评价 库 、 全 文 链接 库 和 文献 数据 库 。 这 些 数据 库 分别 文 撑 着 业务 层 的 相关 业务 逻辑 模 
块 。 其 中 文献 数据 库 是 系统 中 最 重要 的 数据 库 。 下 面 详 细 介绍 一 下 文献 数据 库 的 加 工 流程 。 


1， 电子 资源 导入 到 合并 库 
电子 资源 提供 方 可 能 提供 各 种 格式 异 构 数据 格式 ,为 了 能 够 正常 导入 到 合并 库 中 ， 
我 们 需要 对 各 种 异 构 数 据 格式 进行 分 析 ， 建 立 异 构 数 据 格式 对 合并 库 的 抽取 和 了 映射 关 
系 。 可 以 用 专用 工具 直接 将 易 购 数 据 导入 到 合并 库 中 ， 如 果 映 射 关系 比较 复杂 ， 也 可 以 
开发 专门 的 工具 软件 来 导入 特定 的 电子 资源 ,电子 资源 男 一 种 进入 合并 库 的 方式 是 收割 。 
比如 可 以 开发 专用 收割 程序 ， 定 时 将 特定 网 站 上 的 电子 资源 按 更 新 日 期 收割 到 合并 库 


中 。 
如 果 电子 资源 的 规范 性 、 准 确 度 较 差 ， 可 能 还 要 编写 数据 清洗 程序 对 数据 进行 筛选 ， 
剔除 不 符合 要 求 的 数据 。 必 要 时 要 进行 人 工 处 理 。 
为 了 使 系统 的 数据 收割 /导入 工作 运行 得 更 平稳 和 有 效率 , 应 该 建立 比较 规范 的 数 

据 导 入 流程 ,一 种 比较 好 的 流程 可 以 采取 以 下 方式 : 定义 统一 的 导入 元 数据 规范 ， 规 范 

中 规定 了 统一 的 数据 结构 和 各 个 字段 项 内 容 的 规范 。 各 电子 资源 提供 方 将 数据 转换 为 符 

合 此 规范 的 格式 ， 一 般 为 XML 文件 。 系 统 提 供 统一 的 导入 接口 ， 由 提供 方 自行 导入 ， 也 

可 以 指定 从 特定 的 源 进行 收割 。 
2.， 数 据 的 合并 、 查 重 
由 于 合并 库 有 各 个 元 数据 提供 者 提供 ， 这 不 可 避免 的 导致 库 内 存在 重复 数据 。 为 了 
是 高 客户 的 体验 ， 合 并 、 去 重工 作 十 分 重要 。 

可 以 以 若干 组 关键 标识 字段 座位 判断 元 数据 重复 的 标准 。 如 DOI 字段 可 以 单独 作为 
一 个 去 重 标 准 ， 标 题 、 作 者 、 年 份 、 页 码 可 以 作为 一 个 去 重 标准 ,按照 这 些 组 标准 确定 不 
同 元 数据 之 间 是 否 存 在 重复 关系 。 
确定 若干 条 元 数据 之 间 的 重复 关系 后 ， 下 一 步 工作 就 是 将 多 条 元 数据 合并 为 一 条 。 
一 个 比较 简单 的 策略 是 按照 元 数据 提供 方 的 规范 程度 ， 直 接 选取 规范 程度 较 高 的 提供 
方 的 元 数据 作为 合并 后 的 元 数据 。 男 一 种 更 为 完善 的 方法 则 以 规范 程度 较 融 的 提供 方 的 
元 数据 作为 基准 ， 逐 个 字段 比较 重复 元 数据 的 规范 程度 。 将 规范 度 高 的 记录 的 字段 内 容 
一 填 入 基准 元 数据 记录 的 相应 字段 ， 必 要 时 进行 人 工 处 理 。 这 种 方式 可 以 提高 合并 后 元 数 
据 的 质量 ， 但 是 降低 了 效率 ， 并 提高 了 系统 复杂 度 


4 3， 数 据 内 容 规范 

一 系统 中 有 专门 负责 数据 内 容 规范 的 子 系统 ， 其 中 包含 了 作者 姓名 、 机 构 、 关 键 词 、 基 
和 金 学 科 分 类 、 刊 名 ,语种 出 版 社 等 规范 表 。 这 些 表 种 包含 了 字段 规范 内 容 和 非 规范 内 容 
QQ 的 对 应 关系 。 当 系统 中 导入 新 数据 时 ， 数 据 规范 子 系统 就 可 以 根据 这 些 表 对 新 数据 的 不 
> 规范 内 容 进行 规范 。 数 据 规范 表 应 该 不 断 更 新 ， 保 证 数据 的 准确 和 有 效 性 。 


4.， 建立 索引 、 提 供 索引 服务 

为 了 让 用 户 快速 检索 到 自己 想 要 的 文献 元 数据 ， 必 须 对 合并 、 规 范 后 的 数据 建立 索 
全 引 。 根据 用 户 的 检索 需求 ， 分 析出 应 该 建立 索引 的 元 数据 字段 。 一 般 通 用 的 单一 检索 框 
一 需要 对 所 有 检索 字段 建立 全 文 索引 ;如 果 系 统 提供 高 级 检索 模式 ， 那 么 为 了 满足 对 某 
名 字段 的 精确 检索 需求 ， 需 要 对 整个 字段 内 容 建 立 非 全 文 索引 。 索 引文 件 建立 后 可 以 通过 
全 文 检索 引擎 对 外 提供 检索 服务 ， 全 文 检索 引擎 按照 功能 大 致 可 以 分 为 检索 模块 和 存 
储 模块 。 当 用 户 提交 检索 条 件 时 ， 检 索 条 件 种 的 检索 内 容 将 会 根据 语言 进行 适当 的 分 词 
后 ， 提 交 给 全 文 检索 引擎 中 搜索 模块 进行 检索 ， 搜 索 模块 会 通过 全 文 检 索引 擎 中 的 存 
储 模块 直接 访问 索引 文件 进行 查找 ， 再 将 搜索 到 的 内 容 返 回 给 用 户 。 


应 用 层 


Ca 


根据 功能 划分 ， 应 用 层 根据 分 为 若干 子 系统 : 

1， 规范 子 系统 

其 中 包含 多 种 规范 表 ， 负 责 对 文献 库 中 若干 字段 内 容 进行 规范 
2. 用 户 评论 子 系统 

负责 用 户 对 文献 的 评论 和 打分 

3. 用 户 统 一 认证 子 系统 


负责 系统 
资源 情景 敏感 子 系统 
负责 根据 用 户 所 在 环境 是 


馆 内 环境 下 使 用 。 还 可 以 根据 月 


况 ， 以 便 到 馆 借阅 。 


.， 馆藏 子 系统 
记录 了 各 个 电子 资源 提供 方 的 馆藏 情况 ， 


户 找到 一 篇 文献 资源 时 ， 如 


j 户 的 认证 和 权限 管理 ， 如 系统 内 某 些 特定 资 


四 次 
林 贷 


否 在 馆 内 ， 决 定 资源 的 使 用 权限 。 某 些 资源 只 能 在 图 书 
户 所 在 的 为 止 提 供 


并 在 母体 层 


文献 所 在 附近 


源 有 多 个 馆藏 ， 会 同时 列 出 供 


只 对 部 分 用 户 开放 。 


图 书馆 的 馆藏 情 


面 进行 了 规范 和 去 重 。 当 用 


用 户 选择 。 


. 母体 管理 子 系统 
对 所 有 电子 资源 的 母体 信息 进行 编目 ,并 对 到 馆 信息 进行 登 到 。 
资源 评价 子 系统 
与 用 户 评 价 子 系统 不 同 ， 资 源 评价 子 系统 是 根据 一 系列 科学 评价 的 客观 指标 ， 利 
一 系列 工具 或 插件 ， 对 系统 里 的 母体 或 文献 进行 评价 。 目 前 比较 著名 的 分 析 工 


具有 EBSCO 公司 的 PLUMX。 
8. 全 文 定 位 子 系统 


> 使 用 静态 或 动态 定位 方法 ， 定 位 用 户 请 求 文献 全 文 的 网 络 地 址 。 如 果 一 篇 文献 有 
加 多 个 馆藏 ， 可 以 让 用 户 选 择 请 求 特定 的 馆藏 全 文 。 
9， 检索 子 系统 
= 提供 文献 检索 服务 。 这 是 系统 里 最 基础 、 最 重要 的 服务 ， 资 源 发 现 服务 的 核心 功能 
表现 层 
CN 
SO 表现 层 即 WEB 服务 ， 由 若干 前 台 页 面 组 成 ， 根 据 不 同 的 功能 划分 可 以 分 为 若干 组 : 
A 1， 文 献 检 索 
> 包括 单一 输入 框 检索 ， 和 适用 于 更 专业 人 员 使 用 的 多 条 件 检索 和 高 级 表达 式 检索 
页 面 。 另 外 还 包括 检索 结果 页 面 。 
2. 资源 导航 
可 以 根据 刊 名 会议 名 、 分 类 号 等 字段 分 别 对 不 同文 献 类 型 文献 进行 导航 ， 帮 助 用 
户 快速 浏览 自己 想 要 的 文献 。 
3， 检索 结果 分 二 
根据 多 个 指标 对 文献 检索 结果 进行 分 面 显示 ， 如 出 版 年 分 类 、 文 献 类 型 、 刊 名 等 。 


4. 文献 全 文 定 位 与 获取 


提供 一 组 页 面 供 读者 获取 自己 想 要 的 全 文 链接 ， 如 果 找 不 到 全 文 链接 ， 应 该 有 页 
面 提 供 原 文 传递 服务 。 

5. 用户 评价 
j 户 可 以 在 相关 页 面 对 某 篇 文献 发 表 评 论 或 评分 。 


6. 资源 情景 敏感 
在 页 面 根据 用 户 所 在 位 置 推荐 附近 的 馆藏 资源 ， 以 便 到 馆 借阅 相关 文献 。 


7. 用 户 认证 与 权限 管理 
包括 用 户 登 录 、 注 册 与 个 人 信息 管理 页 面 ， 某 些 特定 资源 的 显示 与 获取 也 与 当前 
j 户 的 权限 有 关 。 


3、 ”资源 发 现 服务 系统 的 技术 要 点 


在 资源 发 现 服务 系统 的 建设 过 程 中 ， 需 要 一 些 关 键 技术 的 支持 ， 下 面 分 别 介绍 一 
些 主要 的 关键 技术 。 


1， 全 文 检索 技术 

在 上 面 对 资源 发 现 服 务 系统 的 分 析 中 ， 我 们 可 以 看 到 用 户 使 用 最 频繁 的 模块 仍然 
是 文献 检索 功能 ， 这 可 以 看 作 是 决定 系统 成 败 的 核心 功能 。 所 以 选择 一 种 能 够 准确 、 快 速 在 
海量 文献 检索 出 用 户 所 需要 的 文献 的 全 文 检索 引擎 尤其 重要 。 从 整个 用 户 群体 的 需求 来 看 
全 文 检索 引擎 要 有 如 下 几 个 特点 : 

1/ 检索 响应 速度 要 快捷 。 
用 户 的 体验 好 坏 直 接 取 决 于 返回 检索 结果 的 时 间 长 短 ， 要 提高 用 户 体 验 ， 返 回 时 间 越 
短 越 好 。 在 目前 的 大 数据 时 代 ， 文 献 检 索 系 统 种 的 数据 量 也 是 非常 庞大 的 。 在 海量 数据 中 检 
索 ， 保 证 响应 速度 尤其 重要 。 

2/ 要 有 优秀 的 中 文 分 词 算法 。 

分 词 是 全 文 检索 的 基础 工作 ， 而 中 文 的 词 之 间 没 有 分 隔 符 ， 这 与 英语 等 西方 语言 有 明 
显 的 区 别 。 中 文 只 是 字 、 句 和 段 能 通过 明显 的 分 界 符 来 简单 划分 ， 唯 独 词 没有 一 个 形式 上 的 
分 界 符 ， 虽 然 英 文 也 同样 存在 短语 的 划分 问题 ， 但 是 在 词 这 一 层 上 ， 中 文 比 之 英文 要 复杂 
和 困难 的 多 四 由 于 中 文 分 词 技术 是 自然 语言 检索 里 的 基础 性 技术 ， 目 前 相关 研究 比较 多 。 在 
文中 ， 将 中 文 分 词 算法 分 为 三 大 类 : 基于 字符 串 匹 配 的 分 词 方法 、 基 于 理解 的 分 词 方法 和 
基于 统计 的 分 词 方法 。 介 绍 了 中 文 分 词 的 发 展现 状 及 在 搜索 引擎 中 的 运用 。 

3/ 叙 词 表 在 中 分 分 词 中 的 利用 

与 普通 互联 网 检索 引擎 不 同 ， 科 技 文 献 中 含有 大 量 的 专业 词汇 ， 使 用 通用 中 文 分 词 算 
法 并 不 能 取得 很 好 的 效果 。 统 词 表 又 称 为 主题 词 表 ， 它 是 一 种 语义 词典 ， 由 术语 及 术语 之 间 
的 各 种 关系 组 成 ， 能 反映 某 学 科 领 域 的 语义 相关 概念 。 包 我 们 可 以 把 虚词 表 中 的 术语 表 作 为 
一 种 专业 词 库 ， 加 入 到 全 文 分 词 的 自 定 义 词 库 中 。 这 将 明显 提高 分 词 的 准确 性 。 文 名 中 提出 
了 将 医学 叙 词 表 MeSH 词汇 加 入 到 通用 分 词 表 中 进行 分 词 ， 并 利用 MeSH 词汇 结合 词 长 、 词 
语 所 在 位 置 加 权 实 现 医 学 新 闻 网 页 的 关键 词 自 动 提取 策略 。 


2， 云 计算 技术 
由 于 资源 发 现 服务 系统 中 的 文献 数据 量 特 别 巨大 ， 其 最 终 形成 的 索引 库 也 是 非常 庞大 
四 的 。 靠 单机 往往 难以 承担 重任 。 此 时 的 索引 方案 是 将 整个 文档 集合 划分 为 若干 子 集 ， 建 立 分 
9 布 式 集群 ， 即 每 台 机 器 维护 整个 索引 的 一 部 分 ， 由 多 台 机 器 共同 完成 索引 的 建立 和 对 检索 
的 响应 。" 当 用 户 发 出 检索 请 求 时 ， 一 台 检 索 分 发 服务 器 将 请 求 分 发 给 多 台 检 索 服务 器 。 每 


台 检 索 服务 器 完成 检索 后 将 结果 返回 给 分 发 服务 器 ， 再 经 过 合并 、 排 序 后 返回 给 用 户 结 
目前 主流 的 全 文 检索 引擎 都 支持 这 种 并 行 计算 扩展 。 随 着 资源 发 现 服务 系统 用 户 数量 增多 、 
文献 数据 量 不 断 增 大 ， 系 统 所 需要 的 服务 器 资源 也 不 断 增 加 ,我们 可 以 把 系统 种 的 检索 模块 
部 署 在 云 计 算 平 台 ， 根 据 系统 访问 量 和 数据 量 的 变化 动态 调整 用 于 并 行 检索 计算 的 服务 器 
数量 。 这 样 较 传统 的 数据 中 心机 房 有 降低 运营 成 本 、 动 态 可 扩展 、 简 化 维护 等 优势 。 
3， 全 文 定位 获取 机 制 

用 户 访 问 资源 发 现 服务 系统 的 最 终 目 的 是 获取 到 自己 需要 的 文献 全 文 ， 做 好 这 最 后 一 
步 需 求 是 系统 成 败 的 关键 之 一 。 可 以 采取 多 种 机 制定 位 和 获取 全 文 。 

1/ 对 于 本 馆 的 电子 文献 资源 

这 是 最 容易 获取 全 文 的 一 种 资源 ， 因 为 资源 在 本 馆 存 放 ， 直 接 根据 文献 全 文 地 址 定位 
获取 即 可 。 

2/ 有 Dol 的 文献 元 数据 

DOI 是 "Digital Object Identifier 的 简写 ， 用 来 标识 在 数字 环境 中 的 内 容 对 象 。 通 过 文献 的 


DOI 可 以 获取 文献 的 全 文 数据 。 在 浏览 器 地 址 栏 输入 http://dx.doi.org/， 在 "Resolve A DOl 
Name" 的 提示 框 内 输入 文献 DOl, 点 击 "Go" 按 钮 ，DOI 系统 就 会 自动 链接 到 该 文献 的 url, 并 显 
示 相 应 的 页 面 。 如果 访问 者 购买 了 该 文献 所 在 数据 库 的 资源 使 用 权 ， 则 可 以 直接 下 载 全 文 ; 
如 果 没 有 ， 可 能 需要 单 篇 购买 。 

3/ 由 电子 资源 提供 方 提 供 的 文献 ID 或 者 文献 全 文 URL 

可 以 直接 使 用 文献 电子 资源 提供 方 提高 的 URL 地 址 获取 全 文 ， 也 可 以 通过 提供 方 的 文献 
ID， 按照 一 定 的 格式 拼接 出 全 文 的 URL 地址 。 使 用 此 方法 的 缺点 是 全 文 地 址 的 URL 可 能 会 
发 生变 化 ， 导 致 获取 失败 。 为 了 避免 这 种 情况 ， 需 要 系统 定期 更 新 那些 失效 的 全 文 链接 内 容 。 

4/ 动 态 全 文 获取 

通过 程序 代码 根据 文献 数据 的 关键 字段 (题名 、 作 者 、 出 版 时 间 等 ) 在 资源 提供 方 系统 内 
进行 检索 ， 将 最 符合 检索 条 件 的 文献 数据 的 URL 地 址 返回 用 户 。 这 是 一 种 动态 全 文 地 址 解析 
过 程 ,这 个 过 程 可 以 是 离线 完成 的 ， 即 系统 定时 在 后 台 进 行动 态 解析 并 更 新 ， 也 可 以 在 用 户 
发 出 请 求 后 实时 进行 解析 。 这 种 方法 的 缺点 是 准确 率 的 问题 ， 由 于 检索 并 不 总 是 能 返回 正确 
的 文献 元 数据 ， 所 以 可 能 会 找到 错误 的 结果 。 
文献 资源 发 现 服务 系统 应 该 综合 采用 上 面 各 种 机 制 来 帮助 用 户 定位 和 获取 全 文 ， 在 此 过 
> 程 中 尽 可 能 提供 最 好 的 用 户 体验 。 
4. 检索 结果 排名 算法 设计 

用 户 在 海量 数据 中 进行 检索 ， 得 到 的 也 可 能 是 一 个 很 大 的 检索 结果 集 。 如 何 将 用 户 真 正 
需要 的 文献 排 在 显示 结果 中 的 前 面 ， 也 是 决定 着 系统 成 败 的 一 个 关键 点 。 排 序 算法 会 算出 每 
篇 文献 的 排名 指数 ， 应 该 从 两 个 方面 设计 。 
首先 是 计算 文献 与 检索 条 件 之 间 的 相关 度 。 如 果 用 户 检索 文献 题名 与 检索 结果 中 文献 的 
题名 完全 一 致 ， 那 么 相关 度 为 最 高 。 如 果 不 完 全 匹配 ， 要 将 检索 条 件 分 词 后 分 别 计算 每 个 词 
在 文献 元 数据 字段 中 的 词 频 。 这 些 字段 应 该 包括 文献 题名 、 主 题词 .关键 词 、 摘 要 等 字段 。 再 按 
照 一 定 的 权重 计算 出 一 个 总 的 权重 ， 代 表 了 文献 与 检索 条 件 的 相关 程度 。 
其 次 是 考虑 一 些 文献 或 者 文献 母体 的 指标 ， 如 出 版 日 期 、 文 献 类 型 、 文 献 被 引用 次 数 、 母 
体 文献 被 引用 次 数 、 是 否 为 图 书馆 自由 资源 文献 在 系统 内 被 浏览 和 被 请 求全 文 次 数 等 。 还 可 
以 参考 一 些 学 术 性 /同行 评论 ， 并 结合 系统 自身 的 读者 评价 功能 。 

最 后 的 排序 指数 是 按照 上 面 的 各 种 指标 按照 一 定 的 加 权 系 数 相 加 得 出 ， 加 权 系 数 可 能 


当 


| 


生 要 根据 系统 运行 情况 或 者 用 户 意见 进行 调整 。 
© 
4、 ”总 结 与 展望 
图 书馆 检索 系统 总 是 随 着 时 代 而 发 展 。 由 传统 系统 到 联邦 检索 ， 又 从 联邦 检索 发 展 到 资 


源 发 现 系统 。 当 前 的 文献 资源 发 现 服务 系统 适应 了 互联 网 时 代 ， 充 分 考虑 了 用 户 的 检索 习惯 ， 
为 读者 请 求 所 需 全 文 提 供 最 大 的 便利 。 未 来 的 资源 发 现 系统 也 将 以 用 户 需求 与 体验 为 第 一 要 
旨 。 当 前 的 检索 系统 本 质 上 仍然 是 基于 检索 词 进行 检索 ， 随 着 搜索 引擎 技术 的 发 展 ， 未 来 基 
于 语义 的 检索 可 能 会 应 用 到 资源 发 现 系统 中 。 随 着 移动 互联 网 的 普及 ， 文 献 资源 发 现 系统 应 
该 移植 到 移动 设备 上 ， 使 得 用 户 可 以 随时 访问 系统 。 用 户 应 该 可 以 更 多 进行 个 性 化 定制 ， 如 
用 户 如 果 对 检索 结果 的 排序 不 满意 ， 可 以 自 定义 排序 算法 或 者 调整 排序 指标 的 加 权 系 统 等 。 
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Abstract: This paper briefly introduces the basic concepts of literature resource discovery service 
system, and introduce the technology framework of the system in detail according to the basic 
principle,and one of the key technologies used are briefly described. 
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